Dimensionality Reduction (차원 축소)

차원 축소는 고차원 데이터를 보다 낮은 차원으로 변환하여 데이터의 구조적 특성을 유지하면서 불필요한 정보를 제거하는 과정이다.

(1) 왜 차원 축소가 필요한가?

AI/머신러닝에서는 데이터가 수백~수천 개의 특성(feature)을 가질 수 있다. 이럴 경우:

차원 축소를 통해 불필요한 변수를 제거하면 모델 성능 향상과 학습 시간 단축 효과가 있다.

PCA (Principal Component Analysis): 가장 널리 쓰이는 기법으로, 데이터의 분산을 최대화하는 새로운 축으로 변환
t-SNE (t-distributed Stochastic Neighbor Embedding): 고차원 데이터를 2D/3D로 시각화할 때 자주 사용
UMAP (Uniform Manifold Approximation and Projection): t-SNE보다 빠르고 보존성이 좋은 시각화 기법
Autoencoder: 인공신경망을 활용한 비선형적 차원 축소
LDA (Linear Discriminant Analysis): 클래스 간 분리도를 기준으로 축소 (지도학습)